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Beschreibung 

Verfahren zur sprecherabhangigen Spracherkennung und 
Spracherkennungssystem 

5 

Die Erfindung bezieht sich auf ein Verfahren zur 
sprecherabhangigen Spracherkennung mit einem 
Spracherkennungssystem, bei dem Sprachaufierungen eines 
10 Benutzers trainiert werden und den trainierten 

Sprachaufierungen Befehle zugeordnet werden, sowie auf ein 
^^^^ Spracherkennungssystem zur Durchf iihrung des Verf ahrens . 

Ein solches Verfahren ist nach dem Stand der Technik 
r 15 aufgeteilt in einen Spracherkennungsmodus und einen 
Trainingsmodus . Bei dem Spracherkennungsmodus werden 
Sprachaufierungen des Benutzers erfasst, woraufhin in einer 
Datenbank ein der Sprachaufierung zugeordneter Befehl 
aufgefunden wird, sofern die Sprachaufierung eine ausreichende 
20 Ubereinstimmung mit einer Sprachaufierung zeigt, die zu dem 

Befehl gehort und zu einem fruheren Zeitpunkt aufgenommen und 
gespeichert wurde. Im Spracherkennungsmodus ist eine neue 
Zuordnung zwischen einer neuen Sprachaufierung und einem 

•neuen Befehl nicht moglich. Diese Vorgange finden vielmehr in 
dem Trainingsmodus statt, bei dem der Benutzer * 
Sprachaufierungen von sich gibt und jeder einzelnen 
Sprachaufierung nach ihrer Aufnahme einen Befehl zugeordnet. 
Die gewonnene Zuordnung wird in der Datenbank abgelegt. 
Zugeordnete Befehle konnen beispielsweise Anwahlvorgange fttr 
30 Teilnehmer eines Kommunikationsnetzwerkes Oder 
Sprachsteuerbef ehle sein . 

Das Verfahren nach dem Stand der Technik hat den Nachteil, 
dass das Trainieren neuer Befehle insofern umstandlich ist, 
35 dass jedes Mai von dem Spracherkennungsmodus zu dem 

Trainingsmodus von dem Bunutzer aktiv umgeschaltet werden 
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muss. Dies wirkt sich auch negativ auf die Akzeptanz von 
Spracherkennungssystemen im Markt aus . 

Ausgehend hiervon liegt der Erfindung die Aufgabe zugrunde, 
5 ein Verf ahren zur sprecherabhangigen Spracherkennung sowie 
ein Spracherkennungs system dafttr anzugeben, bei dem ein 
Trainieren neuer Befehle zeitsparend durchf tthrbar ist. 

Diese Aufgabe wird hinsichtlich des Verfahrens der eingangs 
10 genannten Art dadurch gelost, dass bei Nichterkennung einer 
Sprachaufierung durch das Spracherkennungssystem dem Benutzer 
angeboten wird, die Sprachaufierung unmittelbar einem neuen 
Bef ehl zuzuordnen. 



"15 Bei der Durchf uhrung des Verfahrens befindet sich ein 

Spracherkennungssystem immer im Spracherkennungsmodus, wobei 
jedoch die Option zur Verftigung steht, bei Nichterkennung 
einer Sprachaufierung unmittelbar eine neue Bef ehlszuordnung 
vorzunehmen. Auf diese Weise ist das Trainieren neuer Befehle 
20 in die Spracherkennung selbst integriert und kann dann 

stattfinden, wenn eine Sprachaufierung nicht erkannt worden 
ist. Befindet sich beispielsweise der Benutzer gerade in der 
Situation, dass er einen neuen Befehl fur ein 
Spracherkennungssystem trainieren will, reicht es aus, eine 

•bisher nicht benutzte Sprachaufierung zu artikulieren, wonach 
das Spracherkennungssystem eine Nichterkennung der neuen 
Sprachaufierung feststellt und dann die Option anbietet, die 
neue Sprachaufierung einem neuen Befehl zuzuordnen. Nach 
Vornahme der Zuordnung kann der Befehl unmittelbar ausgefuhrt 
30 werden. 

Bei einer bevorzugten Aus ftihrungs form kann bei Nichterkennung 
der Sprachaufierung durch das Spracherkennungssystem der 
Benutzer optional entweder die Sprachaufierung wiederholen 
35 Oder die Sprachaufierung einem neuen Befehl zuordnen. Diese 
Aus ftihrungs form tragt der Tatsache Rechnung, dass eine 
Sprachaufierung gerade aufierhalb eines Ahnlichkeitsbereiches 



3 

zu einer Sprachaufierung liegen kann, der bereits ein 
gewiinschter Befehl zugeordnet ist. In diesem Fall ist keine 
Zuordnung einer neuen Sprachaufierung zu einem neuen Befehl 
beabsichtigt . Vielmehr muss diese Sprachaufierung zur 
5 Verkntlpfung mit dem bereits trainierten Befehl wiederholt 
werden. 

Hinsichtlich eines Anf angszustandes eines 
Spracherkennungssystems ist bevorzugt ftir das Verfahren 
10 vorgesehen, dass in dem Fall, wenn noch keiner Sprachaufierung 
ein Befehl zugeordnet ist, das Spracherkennungssystem nach 

•seiner Aktivierung sofort das Trainieren eines neuen Befehls 
anbietet. Dies passiert automatisch, wenn das 
Spracherkennungssystem die erste Sprachaufierung naturgemafi 
•-15 nicht erkennt und die Option anbietet, einen neuen Befehl zu 
trainieren. 

Bei einer weiteren Ausfuhrungsf orm kann vorgesehen sein, dass 
bei Nichterkennung einer Sprachaufierung ftir einen bereits 
20 trainierten Befehl durch das Spracherkennungssystem der 
Benutzer den Befehl auswahlen und diesen Befehl die 
Sprachaufierung zuordnen kann. Dies betrifft den Fall, dass in 
einer Datenbank, welche die Zuordnungen zwischen 
Sprachaufierungen und zugehorigen trainierten Befehlen 

•enthalt, eine „schlechte* Version der Sprachaufierung 
vorliegt, so dass eine Spracherkennung haufig fehlschiagt. In 
diesem Fall ist es moglich, dem bereits trainierten Befehl 
eine neue Sprachaufierung zuzuordnen. 

30 Bevorzugt wird fUr eine Erkennung einer Sprachaufierung ein 

Sprachmuster erzeugt, das der Sprachaufierung zugeordnet ist. 
Solche Sprachmuster, denen eine Extraktion wesentlicher 
Sprachmerkmale der Sprachaufierung zugrunde liegt, werden dann 
auch in der Datenbank verwendet, die in diesem Fall eine 

35 Zuordnung zwischen Sprachmustern und trainierten Befehlen 

enthalt. Nach ihrer Aufnahme wird jede Sprachaufierung in ein 
Sprachmuster umgesetzt, das dann weiter verarbeitet wird, 



beispielsweise fur die Entscheidung, ob es erkennbar ist oder 
nicht, d. h. bereits innerhalb eines Ahnlichkeitsbereiches 
eines Sprachmusters in der Datenbank vorliegt. 

5 In dies em Zusammenhang wird es als bevorzugt angesehen, vor 
einer Zuordnung eines Befehls zu einer Sprachaufierung zu 
priifen, ob die Sprachaufterung zuvor gespeicherten 
SprachauBerungen ahnlich ist. Auf diese Weise wird vermieden, 
dass bei einer Spracherkennung Verwechslungen unter 
10 verschiedenen Befehlen vorkommen, weil die jeweils 

zugehorigen SprachauBerungen einander zu ahnlich sind. Dazu 

•kann, beispielsweise unter Verwendung der Extraktionsmerkmale 
fur ein Sprachmuster , ein zulassiger Ahnlichkeitsbereich 
definiert werden. 

u 15 

Die oben genannte Aufgabe wird hinsichtlich eines 
Spracherkennungssystems gelost durch ein 

Spracherkennungssystem ftir ein sprecherabhangiges Erkennen 
von Sprache mit einer Sprachaufnahmeeinrichtung zur Aufnahme 
20 einer SprachauBerung eines Benutzers des 

Spracherkennungssystems, einer Suchmaschine, die zum Zugriff 
auf eine Datenbank ausgebildet ist, die eine Zuordnung 
zwischen SprachauBerungen und Befehlen enthalt, urn einen der 
SprachauBerung zugeordneten Befehl aufzufinden, 

•einer Umsetzeinrichtung zum Umsetzen des auf Grund der 
Sprachaufierung auf gefundenen Befehls, wobei das 
Spracherkennungssystem derart ausgebildet ist, dass bei 
Nicht erkennung der Sprachaufierung durch das 
* Spracherkennungssystem dem Benutzer angeboten wird, die 

30 Sprachaufierung unmittelbar einem neuen Befehl zuzuordnen. 

Ein solches Spracherkennungssystem erlaubt die Durchftihrung 
des oben beschriebenen Verfahrens und zeichnet sich gegeniiber 
bekannten Spracherkennungssystemen dadurch aus, dass 
35 innerhalb eines Spracherkennungsmodus das Trainieren neuer 
Befehle ermoglicht wird. 
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Bevorzugt ist die Sprachaufnahmeeinrichtung mit einem 
Speicher verbunden, in dem die SprachauBerung 
zwischengespeichert wird und der mit der Datenbank zum 
Einlesen der SprachauBerung in die Datenbank verbunden ist, 
5 Dies ist bei bekannten Spracherkennungssystemen nicht der 

Fall, denn dort wird fur einen Trainingsmodus unmittelbar auf 
die Datenbank zugegriffen, wahrend in einem 
Spracherkennungsmodus eine SprachauBerung fur die Funktion 
der Suchmaschine zwar zwischengespeichert wird, der dann 
10 benutze Speicher aber nicht zum Einlesen einer SprachauBerung 
in die Datenbank ausgebildet/verknllpf t ist. 

m W Vorzugsweise ist eine Merkmalsextraktionseinrichtung zum 

Erzeugen eines Sprachmusters aus der SprachauBerung zwischen 
c 15 der Sprachaufnahmeeinrichtung und dem Speicher vorgesehen und 
das Sprachmuster ersetzt die SprachauBerung. 

Weitere Vorteile und Merkmale des Spracherkennungs systems 
sind bereits oben anhand der Beschreibung des Verfahrens zur 
20 sprecherabhangigen Spracherkennung erlautert worden. 

Ein Ausftthrungsbeispiel der Erfindung wird nachfolgend anhand 
der Zeichnung noch naher erlautert. Die einzige Figur zeigt 
ein Ablaufdiagramm eines Verfahrens zur sprecherabhangigen 
^^^^ • Spracherkennung. 

Ein Verfahren zur sprecherabhangigen Spracherkennung mittels 
eines Spracherkennungs systems wird nunmehr anhand der Figur 1 
erlautert. Nach einem Start des Spracherkennungssystems, das 

30 beispielsweise als Computersystem mit Anzeigeeinrichtung 

realisiert ist, wird einem Benutzer zunachst eine geeignete 
Benutzeroberflache angezeigt, die auch eine Aktivierung flir 
eine Aufnahme einer SprachauBerung beinhaltet („Push-to- 
Talk* -Aktivierung) . In einem ersten Verf ahrensschritt 1 wird 

35 eine SprachauBerung des Benutzers/Sprechers aufgenommen, und 
zwar mit Hilfe einer geeigneten Sprachaufnahmeeinrichtung. 
Mittels einer Merkmalsextraktionseinrichtung wird in einem 
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zweiten Schritt 2 ein Sprachmuster der Sprachaufierung 
erzeugt, wobei ein Sprachmuster durch eine Kombination 
extrahierter, charakteristischer Sprachmerkmale definiert 
ist. Das Sprachmuster wird in einem Speicher 
5 zwischengespeichert . 

In einem dritten Schritt 3 erfolgt mittels einer Suchmaschine 
die Abfrage, ob das erzeugte Sprachmuster in einer Datenbank 
enthalten ist, die Zuordnungen zwischen Sprachmustern und 
10 Befehlen enthalt. Diese Datenbank wird in einem 

Trainingsmodus des Spracherkennungs systems mit Inhalten 

•versehen, wobei der Trainingsmodus in den Vorgang einer 
Spracherkennung integriert ist. Wird das Sprachmuster als in 
der Datenbank bereits vorhanden erkannt und der zugehorige 
v 15 Befehl aufgefunden, wird in einem vierten Schritt der Befehl 
ausgefiihrt, wonach der Betriebsvorgang des 

Spracherkennungssystems beendet ist. Dabei erfolgt der Ablauf 
von dem Schritt 1 bis zu dem Schritt 4 im vorliegenden 
Ausfuhrungsbeispiel automatisch. 

20 

Wird in dem dritten Schritt 3 das erzeugte Sprachmuster nicht 
erkannt, erhalt der Benutzer uber die Benutzeroberf lache des 
Computersystems die Option, dem nicht erkannten Sprachmuster 
bzw. der nicht erkannten Sprachaulierung einen neuen Befehl 

• zuzuordnen. Dies geschieht in einem flinften Schritt 5 des 
Ve'rfahrens. An dieser Stelle wird das Spracherkennungs system 
in einen Trainingsmodus umgeschaltet, sofern die Zuordnung 
eines neuen Befehls gewunscht ist oder automatisch 
herbeigefuhrt wird. Alternativ zu dem flinften Schritt 5 kann 
30 der Benutzer mit Hilfe der Benutzeroberf lache auch eine neue 
SprachauBe rungs -Aufnahme auslosen, so dass zu dem ersten 
Schritt 1 zuriickgekehrt wird, urn die Sprachaufierung zu 
wiederholen. 

35 Wird die Ztfordnung eines neuen Befehls zu dem nicht erkannten 
Sprachmuster gewahlt, erfolgt in einem sechsten Schritt 6 die 
Aufnahme einer Sprach&ufierung, die der nicht erkannten 



£~ \J U J. ZfO U*i 



1 

Sprachaufierung aus dem ersten Schritt entspricht. Im 
Anschluss daran wird in einem siebten Schritt 7 aus der in 
dem sechsten Schritt 6 auf genommenen Sprachauflerung ein 
Sprachmuster erzeugt, und zwar in derselben Weise, wie in dem 
5 oben erlauterten zweiten Schritt 2. 

In einem achten Schritt 8 wird eine Ahnlichkeitsprttfung 
zwischen dem neuen Sprachmuster aus dem siebten Schritt 7 und 
dem Sprachmuster aus dem zweiten Schritt 2 durchgefiihrt . 
10 Liegt ein gewiinschtes Mali an Ubereinstimmung zwischen den 
beiden Sprachmustern nicht vor, beginnt das Verfahren von 

•neuem, bis ein zuf riedenstellendes Ergebnis fttr die 
Ahnlichkeit der in dem zweiten Schritt 2 und in dem siebten 
Schritt 7 erzeugten Sprachmuster vorhanden ist. Dabei konnen 
v 15 der dritte Schritt 3 und der funfte Schritt 5 ubersprungen 
werden . 

In dem achten Schritt 8 kann auch eine Ahnlichkeitspriifung 
dahingehend vorgenommen werden, ob das Sprachmuster der neu 
20 auf genommenen Sprachaufierung einen ausreichenden Abstand 

gegentlber bereits in der Datenbank vorhandenen Sprachmustern 
einhalt. Im negativen Fall kann der Benutzer aufgefordert 
werden, eine andere SprachauBerung zur Zuordnung fiir einen 
_ neuen Befehl zu verwenden. Fur diese neue SprachauBerung 
^^^^ beginnt das Verfahren von neuem. 

Im Anschluss daran wird in einem neunten Schritt 9 dem im 
zweiten Schritt 2 erzeugten Sprachmuster ein Befehl 
zugeordnet, und zwar durch geeignete Auswahl des Benutzer s 

30 mit Hilfe der Benutzeroberf lache des Spracherkennungssystems . 
Dazu wird das Sprachmuster aus dem Speicher, in dem es in dem 
zweiten Schritt 2 zwischengespeichert wurde, ausgelesen, mit 
dem in Schritt 7 erzeugten Sprachmuster geeignet verknupft, 
z. B. durch eine Mittelwertbildung einzelner Eigenschaf ten 

35 beider Sprachmuster, und zusammen mit dem neuen Befehl in die 
Datenbank geschrieben. 
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In einem letzten Schritt 10 wird der neu zugeordnete Befehl 
ausgefuhrt, wonach der Spracherkennungsvorgang mit 
integriertem Trainingsmodus abgeschlossen ist. 

Es ist hervorzuheben, dass die in dem vierten und letzten 
Schritt erfolgende Ausfuhrung eines Befehls mit Hilfe einer 
Umsetzeinrichtung zum Umsetzen des Befehls vonstatten geht. 
Bei dem Befehl kann es sich beispielsweise urn die Anwahl 
einer Telef onnummer in einem Kommunikationsnetzwerk oder 
einen Sprachbefehl handeln, mit dem an ein Netzwerk 
angeschlossene Gerate gesteuert werden. 

Selbstverstandlich kann bei einer vereinf achten 
Ausfuhrungsform des Verfahrens bei der Zuordnung eines 
Befehls nach dem neunten Schritt 9 auf die Durchfuhrung der 
vorangehenden Schritte 6 bis 8 verzichtet werden. Auf diese 
Weise erfolgt die Zuordnung eines Befehls unmittelbar auf die 
Abfrage aus dem fiinften Schritt 5. Auch ist es moglich, bei 
der Durchfuhrung des Verfahrens auf die unmittelbare 
Ausfuhrung des neu trainierten Befehls (zehnter Schritt) zu 
verzichten. 
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Patentanspruche 

1 . Verf ahren zur sprecherabhangigen Spracherkennung mit einem 
Spracherkennungssystem, bei dem SprachauBerungen eines 
5 Benutzers trainiert werden und den trainierten 
SprachauBerungen Befehle zugeordnet werden, 
dadurch gekennzeichnet, dass bei 
Nichterkennung einer SprachauBerung durch das 
Spracherkennungssystem dem Benutzer angeboten wird, die 
10 SprachauBerung unmittelbar einem neuen Befehl zuzuordnen. 

• 2. Verf ahren nach Anspruch 1, 
dadurch gekennzeichnet, dass 
bei Nichterkennung der SprachauBerung durch das 
-15 Spracherkennungssystem der Benutzer optional entweder die 
SprachauBerung wiederholen oder die SprachauBerung einem 
neuen Befehl zuordnen kann. 

3. Verf ahren nach einem der Ansprtiche 1 oder 2, 
20 dadurch gekennzeichnet, dass 

in dem Fall, wenn noch keiner SprachauBerung ein Befehl 
zugeordnet ist, das Spracherkennungssystem nach seiner 
Aktivierung das Trainieren eines neuen Befehls anbietet. 

•4. Verf ahren nach einem der Anspruche 1 bis 3, 
dadurch gekennzeichnet, dass 
bei Nichterkennung einer SprachauBerung fiir einen bereits 
trainierten Befehl durch das Spracherkennungssystem der 
Benutzer den Befehl auswahlen und diesem Befehl die 
30 SprachauBerung zuordnen kann. 

♦ 

5. Verf ahren nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, dass 
fur eine Erkennung einer SprachauBerung ein Sprachmuster 
35 erzeugt wird, dass der SprachauBerung zugeordnet ist. 
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6. Verfahren nach einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, dass 
vor einer Zuordnung eines Befehls zu einer SprachauBerung 
gepruft wird, ob die SprachauBerung zuvor gespeicherten 

5 SprachauBerungen ahnlich ist. 

7 . Spracherkennungssystem fUr ein sprecherabhangiges Erkennen 
von Sprache mit 

einer Sprachaufnahmeeinrichtung zur Aufnahme einer 
SprachauBerung eines Benutzers des Spracherkennungs systems, 
einer Suchmaschine, die zum Zugriff auf eine Datenbank 
ausgebildet ist, die eine Zuordnung zwischen SprachauBerungen 
und Befehlen enthalt, urn einen der SprachauBerung 
zugeordneten Befehl aufzufinden, 

einer Umsetzeinrichtung zum Umsetzen des auf Grund der 
SprachauBerung auf gef undenen Befehls, 
dadurch gekennzeichnet, dass 
das Spracherkennungssystem derart ausgebildet ist, dass bei 
Nichterkennung der SprachauBerung durch das 
Spracherkennungssystem dem Benutzer angeboten wird, die 
SprachauBerung unmittelbar einem neuen Befehl zuzuordnen. 

8. Spracherkennungssystem nach Anspruch 7, 
dadurch gekennzeichnet, dass 

•die Sprachaufnahmeeinrichtung mit einem Speicher verbunden 
ist, in dem die SprachauBerung zwischengespeichert wird und 
der mit der Datenbank zum Einlesen der SprachauBerung in die 
Datenbank verbunden ist. 

30 9. Spracherkennungssystem nach einem der Ansprtiche 7 oder 8, 
dadurch gekennzeichnet, dass 
eine Merkmalsextraktionseinrichtung zum Erzeugen eines 
Sprachmusters aus der SprachauBerung zwischen der 
Sprachaufnahmeeinrichtung und dem Speicher vorgesehen ist und 

35 das Sprachmuster die SprachauBerung ersetzt. 
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Zusammenf as sung 

Verfahren zur sprecherabhangigen Spracherkennung und 
Spracherkennungs system dafiir 

Bei einem Verfahren zur sprecherabhangigen Spracherkennung 
mit einem Spracherkennungssystem, bei dem SprachauJierungen 
des Benutzers trainiert werden und den trainierten 
Sprachaufierungen Befehle zugeordnet werden, wird die Aufgabe, 
ein Trainieren neuer Befehle zeitsparend durchzuftihren, 
dadurch gelost, dass bei Nichterkennung einer Sprachaufierung 
durch das Spracherkennungssystem dem Benutzer angeboten wird, 
die Sprachaufierung unmittelbar einem neuen Befehl zuzuordnen. 



Figur 
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